dataPredictDans ce projet, nous avons essayé de prédire un problème de classification dans un ensemble de données sur les diabete par une variété de modèles pour classifier les prédictions des diabetes dans le contexte de déterminer si quelqu'un est susceptible d'avoir un accident vasculaire cérébral en fonction des paramètres d'entrée comme le sexe, l'âge et divers résultats de test ou non. Nous avons analysé en détail la cible et les caractéristiques. Nous avons vérifié les modèles obtenus à partir des ensembles de formation en appliquant une validation croisée pour chaque performance de modèle. Enfin, nous avons examiné visuellement les résultats de tous les modèles afin de sélectionner le meilleur pour le problème en question. En vérifiant tous les scores comme F1_score, Precision, Recall et Accuracy, Gradient Boosting et KNN donnent les meilleurs résultats en comparaison avec les autres modèles. Pour les ensembles de données respectifs, Gradient Boosting et KNN sont les meilleurs modèles pour les prédictions futures.

Les résultat sont les mèmes pour les deux modèles donc on peut dire que deux personnes sont en bonne senté et un est en état de diabete.